<!DOCTYPE html>
<html lang="en">
<head>
	<meta charset="UTF-8">
	<meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
	<title>类型和映射 | Elasticsearch: 权威指南 | Elastic</title>
    <!-- Give IE8 a fighting chance -->
    <!--[if lt IE 9]>
    <script src="https://oss.maxcdn.com/html5shiv/3.7.2/html5shiv.min.js"></script>
    <script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
    <![endif]-->
	<link rel="stylesheet" type="text/css" href="../static/styles.css" />
</head>
<body>
<div class="main-container">
    <section id="content">
        
        <div class="content-wrapper">
            <section id="guide" lang="zh_cn">
                <div class="container">
                    <div class="row">
                        <div class="col-xs-12 col-sm-8 col-md-8 guide-section">
                            <div style="color:gray; word-break: break-all; font-size:12px;">原文地址: <a href="https://www.elastic.co/guide/cn/elasticsearch/guide/current/mapping.html" rel="nofollow">https://www.elastic.co/guide/cn/elasticsearch/guide/current/mapping.html</a>, 版权归 www.elastic.co 所有<br/>
                            英文版地址: <a href="https://www.elastic.co/guide/en/elasticsearch/guide/current/mapping.html" rel="nofollow">https://www.elastic.co/guide/en/elasticsearch/guide/current/mapping.html</a>
                            </div>
                        <!-- start body -->
                  <div class="page_header">
<b>请注意:</b><br>本书基于 Elasticsearch 2.x 版本，有些内容可能已经过时。
</div>
<div id="content">
<div class="breadcrumbs">
<span class="breadcrumb-link"><a href="index.html">Elasticsearch: 权威指南</a></span>
»
<span class="breadcrumb-link"><a href="getting-started.html">基础入门</a></span>
»
<span class="breadcrumb-link"><a href="index-management.html">索引管理</a></span>
»
<span class="breadcrumb-node">类型和映射</span>
</div>
<div class="navheader">
<span class="prev">
<a href="custom-analyzers.html">« 自定义分析器</a>
</span>
<span class="next">
<a href="root-object.html">根对象 »</a>
</span>
</div>
<div class="section">
<div class="titlepage"><div><div>
<h2 class="title">
<a id="mapping"></a>类型和映射<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/070_Index_Mgmt/25_Mappings.asciidoc">edit</a>
</h2>
</div></div></div>
<p><em>类型</em> 在 Elasticsearch 中表示一类相似的文档。 类型由 <em>名称</em> —比如 <code class="literal">user</code> 或 <code class="literal">blogpost</code> —和 <em>映射</em> 组成。</p>
<p><em>映射</em>, 就像数据库中的 schema ，描述了文档可能具有的字段或 <em>属性</em>  、每个字段的数据类型—比如 <code class="literal">string</code>,
<code class="literal">integer</code> 或 <code class="literal">date</code> —以及Lucene是如何索引和存储这些字段的。</p>
<p>类型可以很好的抽象划分相似但不相同的数据。但由于 Lucene 的处理方式，类型的使用有些限制。</p>
<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="_lucene_如何处理文档"></a>Lucene 如何处理文档<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/070_Index_Mgmt/25_Mappings.asciidoc">edit</a>
</h3>
</div></div></div>
<p>在 Lucene 中，一个文档由一组简单的键值对组成。 每个字段都可以有多个值，但至少要有一个值。
类似的，一个字符串可以通过分析过程转化为多个值。Lucene 不关心这些值是字符串、数字或日期—​所有的值都被当做 <em>不透明字节</em> 。</p>
<p>当我们在 Lucene 中索引一个文档时，每个字段的值都被添加到相关字段的倒排索引中。你也可以将未处理的原始数据 <em>存储</em> 起来，以便这些原始数据在之后也可以被检索到。</p>
</div>

<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="_类型是如何实现的"></a>类型是如何实现的<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/070_Index_Mgmt/25_Mappings.asciidoc">edit</a>
</h3>
</div></div></div>
<p>Elasticsearch 类型是以 Lucene 处理文档的这个方式为基础来实现的。一个索引可以有多个类型，这些类型的文档可以存储在相同的索引中。</p>
<p>Lucene 没有文档类型的概念，每个文档的类型名被存储在一个叫 <code class="literal">_type</code> 的元数据字段上。 当我们要检索某个类型的文档时, Elasticsearch 通过在 <code class="literal">_type</code> 字段上使用过滤器限制只返回这个类型的文档。</p>
<p>Lucene 也没有映射的概念。 映射是 Elasticsearch 将复杂 JSON 文档 <em>映射</em> 成 Lucene 需要的扁平化数据的方式。</p>
<p>例如，在 <code class="literal">user</code> 类型中， <code class="literal">name</code> 字段的映射可以声明这个字段是 <code class="literal">string</code> 类型，并且它的值被索引到名叫 <code class="literal">name</code> 的倒排索引之前，需要通过 <code class="literal">whitespace</code> 分词器分析：</p>
<div class="pre_wrapper lang-js">
<pre class="programlisting prettyprint lang-js">"name": {
    "type":     "string",
    "analyzer": "whitespace"
}</pre>
</div>
</div>

<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="_避免类型陷阱"></a>避免类型陷阱<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/070_Index_Mgmt/25_Mappings.asciidoc">edit</a>
</h3>
</div></div></div>
<p>这导致了一个有趣的思想实验： 如果有两个不同的类型，每个类型都有同名的字段，但映射不同（例如：一个是字符串一个是数字），将会出现什么情况？</p>
<p>简单回答是，Elasticsearch 不会允许你定义这个映射。当你配置这个映射时，将会出现异常。</p>
<p>详细回答是，每个 Lucene 索引中的所有字段都包含一个单一的、扁平的模式。一个特定字段可以映射成 string 类型也可以是 number 类型，但是不能两者兼具。因为类型是 Elasticsearch 添加的 <em>优于</em> Lucene 的额外机制（以元数据 <code class="literal">_type</code> 字段的形式），在 Elasticsearch 中的所有类型最终都共享相同的映射。</p>
<p>以 <code class="literal">data</code> 索引中两种类型的映射为例：</p>
<div class="pre_wrapper lang-js">
<pre class="programlisting prettyprint lang-js">{
   "data": {
      "mappings": {
         "people": {
            "properties": {
               "name": {
                  "type": "string",
               },
               "address": {
                  "type": "string"
               }
            }
         },
         "transactions": {
            "properties": {
               "timestamp": {
                  "type": "date",
                  "format": "strict_date_optional_time"
               },
               "message": {
                  "type": "string"
               }
            }
         }
      }
   }
}</pre>
</div>
<p>每个类型定义两个字段 (分别是 <code class="literal">"name"</code>/<code class="literal">"address"</code> 和 <code class="literal">"timestamp"</code>/<code class="literal">"message"</code>
)。它们看起来是相互独立的，但在后台 Lucene 将创建一个映射，如:</p>
<div class="pre_wrapper lang-js">
<pre class="programlisting prettyprint lang-js">{
   "data": {
      "mappings": {
        "_type": {
          "type": "string",
          "index": "not_analyzed"
        },
        "name": {
          "type": "string"
        }
        "address": {
          "type": "string"
        }
        "timestamp": {
          "type": "long"
        }
        "message": {
          "type": "string"
        }
      }
   }
}</pre>
</div>
<p><em>注: 这不是真实有效的映射语法，只是用于演示</em></p>
<p>对于整个索引，映射在本质上被 <em>扁平化</em> 成一个单一的、全局的模式。这就是为什么两个类型不能定义冲突的字段：当映射被扁平化时，Lucene 不知道如何去处理。</p>
</div>

<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="_类型结论"></a>类型结论<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/070_Index_Mgmt/25_Mappings.asciidoc">edit</a>
</h3>
</div></div></div>
<p>那么，这个讨论的结论是什么？技术上讲，多个类型可以在相同的索引中存在，只要它们的字段不冲突（要么因为字段是互为独占模式，要么因为它们共享相同的字段）。</p>
<p>重要的一点是: 类型可以很好的区分同一个集合中的不同细分。在不同的细分中数据的整体模式是相同的（或相似的）。</p>
<p>类型不适合 <em>完全不同类型的数据</em> 。如果两个类型的字段集是互不相同的，这就意味着索引中将有一半的数据是空的（字段将是 <em>稀疏的</em> ），最终将导致性能问题。在这种情况下，最好是使用两个单独的索引。</p>
<p>总结：</p>
<div class="ulist itemizedlist">
<ul class="itemizedlist">
<li class="listitem">
<span class="strong strong"><strong>正确:</strong></span> 将 <code class="literal">kitchen</code> 和 <code class="literal">lawn-care</code> 类型放在 <code class="literal">products</code> 索引中, 因为这两种类型基本上是相同的模式
</li>
<li class="listitem">
<span class="strong strong"><strong>错误:</strong></span> 将 <code class="literal">products</code> 和 <code class="literal">logs</code> 类型放在 <code class="literal">data</code> 索引中, 因为这两种类型互不相同。应该将它们放在不同的索引中。
</li>
</ul>
</div>
</div>

</div>
<div class="navfooter">
<span class="prev">
<a href="custom-analyzers.html">« 自定义分析器</a>
</span>
<span class="next">
<a href="root-object.html">根对象 »</a>
</span>
</div>
</div>

                  <!-- end body -->
                        </div>
                        <div class="col-xs-12 col-sm-4 col-md-4" id="right_col">
                        
                        </div>
                    </div>
                </div>
            </section>
        </div>
    </section>
</div>
<script src="../static/cn.js"></script>
</body>
</html>